"Vượt rào" ChatGPT

ChatGPT được huấn luyện để từ chối các prompt có thể vi phạm chính sách nội dung của nó. Tuy nhiên, một số người dùng đã vòng qua được những giới hạn và hạn chế này thông qua những kỹ thuật như prompt engineering.[31] Việc "vượt rào" như vậy mở ra con đường cho phép người dùng thao túng ChatGPT đưa ra những output có thể bị người ta coi là xúc phạm, không phù hợp, hoặc có nguy cơ gây hại cho xã hội.[32] Sau đây bao gồm một số phương pháp được sử dụng để đi vòng qua bộ lọc của ChatGPT:

  1. Bảo ChatGPT tiếp nối một lời phát biểu nào đó trong một cuộc phỏng vấn giả nào đó.
  2. Hướng dẫn cho nó tắt bộ lọc trò chuyện đi.
  3. Gợi nhắc (prompt) nó giải mật mã một tin nhắn chứa hướng dẫn rồi làm theo nội dung đó.
  4. Bảo nó đóng vai một chiếc máy tính và xuất hiển thị của nó dưới dạng tranh ASCII.

Tài liệu tham khảo

WikiPedia: ChatGPT http://chat.openai.com/chat http://www.arxiv.org/abs/2210.10760 https://www.smh.com.au/national/is-ai-coming-of-ag... https://www.cbc.ca/radio/thecurrent/chatgpt-human-... https://arstechnica.com/information-technology/202... https://www.bleepingcomputer.com/news/technology/o... https://www.bloomberg.com/opinion/articles/2022-12... https://www.cnbc.com/2022/12/15/google-vs-chatgpt-... https://www.cnn.com/2022/12/05/tech/chatgpt-trnd/i... https://www.lesswrong.com/posts/RYcoJdvmoBbi5Nax7/...